Oficina 2

CE II: Visualização de dados

Carolina Musso

DEPAT/IPE-DF

Luiz Oliveira
Rafael de Acypreste

Oficina 2

  • Importância da visaulização de dados
    • Diferença entre exploratória e descritiva
  • Tipos de variáveis e tipos de gráficos
    • Quantitativa e Qualitativa
  • Principais atributos em uma visualização
    • Cores, formas, eixos
  • Exemplos de gráficos
    • Bons e Ruins
  • Storytelling com dados

Visualização de dados

O que é

  • É a representação de dados para facilitar a interpretação.

  • Área interdisciplinar:

    • estatística, arte, comunicação.

Porque fazer

  • Tornar análise de dados mais acessível.

  • Difíceis de automatizar: dificilmente ficará obsoleta.

  • DataViz, para os íntimos

Para que serve

  • Com a base completa de dados:
    • Não é inteligível.
    • Necessário resumir.

Como fazer

  • Nem sempre os números funcionam …

  • Fazer uso de outros elementos

Exploratória X Descritiva

Análise Exploratória

  • É um trabalho de investigação de dados

    • A ferramenta: precisa ser rápida/fácil

    • O objetivo é aprender

Análise descritiva

  • É um trabalho de otimização visual

    • A ferramenta: precisa ser customizável

    • O objetivo é comunicar

Spoiler alert

  • o ggplot2 faz as duas coisas!

Onde usamos a visualização

Exploratória X Descritiva

Exploratória

pacman::p_load(tidyverse, palmerpenguins, fstatix,
               ggtext)
ggplot(data = mtcars, aes(x = hp, y = mpg)) +
  geom_point()

Descritiva

ggplot(data = mtcars, aes(x = hp, y = mpg)) +
  geom_point(size=3, color = "steelblue4") +
  geom_smooth(se = F, color = "indianred3")+
  theme_classic(base_size = 16) +
  labs(title = "Relação entre cavalos e consumo de combustível",
       x = "Cavalos",
       y = "Milhas por galão")

Análise Exploratória

  • Dar sentido em todas as informações

  • Trabalho de detetive

  • Ajuda a levantar hipóteses

  • EDA (Exploratory Data Analysis)

O que é otimização visual?

  • Aprimorar a visualização pata melhorar a comunicação.

  • Cores, fontes, elementos geométricos, entre outros, a partir de um gráfico exploratório.

  • Não é uma ciência exata.

Atributos visuais a serem explorados

  • Geometrias

  • Cores

  • Eixos

  • Formas

  • Tamanhos

  • Posicionamento

Problemas comuns

  • Gráficos ruins.

  • Gráficos “mentirosos”.

  • Gráficos mal feitos ou pouco eficientes.

Gráficos a se evitar

  • Pizza (controverso!)
  • Barras que não começam no zero

Gráficos para tomar cuidado

  • Gráficos com dois eixos
  • Gráficos pouco conhecidos

Primeiro passo

  • Conhecer suas variáveis.

  • Numéricas/Quantitativas: contínuas e discretas

  • Categóricas/Qualitativas: Nominais e Ordinais

Tipos de gráficos

1 variável quantitativa

2 variáveis quantitativas

Tipos de gráficos: Categóricas

1 variável qualitativa

Duas Variáveis qualitativas

Uma variável quantitativa e uma categórica

Como interpretar boxplot

Gráfico de violino

2 quantitativas e 1 categórica

2 quantitativas e 2 categórica

Sites interessantes

from Data to Viz

R gallery

Uso de cores

RGB (Red, Green, Blue)/ Hexadecimal

HSL (Hue, Saturation, Lightness)

Uso de cores

Paletas de cores prontas

  • Escalas qualitativas: utilizado para variáveis nominais (sexo, cor/raça)

  • Escalas divergentes: utilizado para variáveis que têm um centro neutro (favorável/neutro/desfavorável, correlação)

  • Escalas sequenciais: utilizado para variáveis ordinais (faixa etária, renda)

O que faz mais sentido?

Formas

  • Chamar a atenção sem com isso fazer uma bagunça visual.

Eixos

Outros exemplos

Recursos pré-atentativos

  • Uma propriedade visual pré-atentativa é processada pelo nosso cérebro antes de uma ação consciente.

  • Como isso esse processamento é muito rápido, trata-se de uma oportunidade para tornar visualizações mais amigáveis e diretamente interpretadas.

Recursos pré-atentativos

Storytelling com dados

Storytelling com dados

Storytelling com dados

Storytelling com dados

Storytelling com dados

. . .

Storytelling com dados

. . .

Por hoje é só!